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Recunoa§terea Vorbirii §i Analiza Semnalelor 



1 Domeniile tehnice in care inventia poate fi 
utilizata sint 

• Recunoasterea Vorbirii, 

• Recunoasterea Cuvintelor Cheie, 

• Analiza si Recunoasterea Imaginilor, 

• Recunoasterea Segmentelor In Studiul Materiilor Organice (Studiul 
Genornului) 

2 Stadiul tehnicii 

• La recunoasterea cuvintelor cheie se utilizeaza adesea reprezenta- 
rea segmentelor nedorite printr-un model atotcuprinzator de umplu- 
tura <Garbage/Filler Models>. Se utilizeaza modele fonetice de- 
pendente/independente de context si fara constringeri lexicale. Se 
efectueaza apoi o estimare < VITERBI> (probabilitatea maxima a unei 
cai), procedura inainte-inapoi (probabilitatea considerind toate caile) 
sau o reducere a modelului la Programare Dinamica. O alternativa per- 
mite relaxarea constringerii asupra pozitionarii punctelor de inceput si 
de sfirsit ale cuvintelor in secventele rostite [3]. Dar aceasta necesita o 
normalizare ulterioara. 

• Una din cele mai performante metode actuale realizeaza recunoasterea 
cuvintelor cheie prin modelarea segmentelor nedorite utilizind media 
celor mai performante K corespondente in esantion. [2] 

• Studiul genornului se face, in anumite laboratoare (ISREC), pe baza 
reprezentarii secventelor distante de proteine cu functionalitati comune 
sub forma unor modele numite 'Profile Generalizate'. Cu ajutorul aces- 
tora se cauta subsecventele corespondente de DNA. Algoritmul este 



prin cautarea directa a subsecven^elor cu 
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bazat pe Programarea Dinamica cu modificari minore datorate speci- 
ficitatii modelului. Deoarece calculele necesare sint extrem de costisi- 
toare, sisteme paralele de pina la 16 calculatoare (INSECT) sint uti- 
lizate. In aceste zile, o implementare hardware bazata pe FPGA-uri 
5\ a fost realizata [4]. Aceasta calculeaza in jur de 7 milioane celule 

esantion-stare pe secunda. 

• Pentru recunoasterea obiectelor in imaginii exista o gama larga de 
metode. Se utilizeaza cross-corelatia, 'snakes', analiza trasaturilor, a 
texturii, a culorii, etc. Metodele au avantaje si dejavantaje diferite 

1^0 - pentru fiecare aplicatie. In domeniul cartografiei se utilizeaza adesea 

^ 'snakes' ce trebuie initializati de catre operator. In domeniul roboticii se 

" utilizeaza, printre altele, analiza contururilor si cross-corelatia proiec- 

tiilor. 

3 Expunerea Inventiei 

Descriem inventia utilizind notatii si termeni legati de recunoasterea vor- 
birii si utilizind probabilitati posteriorioare. Metodele ramin identice daca 
se folosesc probabilitati sau alte tipuri de aproximare a acestora bazate pe 
aplicatia corespunzatoare, ca de exemplu anumite distante intre valorile cu- 
lorii pixelilor. Scorurile utilizate in profilele secventelor biomoleculare sint de 
2* 0, asemenea acceptabile pentru estimari de posteriori. 

Deasemenea noi folosim minusul logaritmului posteriorilor. Metoda este 
desigur identica daca se folosesc logaritmi pozitivi cu schimbarea semnului 
comparatiilor. Acestea sind detalii de implementare. 

3,1 Descrierea teoretica a problemei 

^•5". In Recunoasterea Vorbirii s-a recomandat [1] utilizarea de masuri de con- 
fidenta (incredere) pentru reestimarea primelor N ipoteze. Modele pro- 
puse contin normalizarea probabilitatii posterioare cumulate peste lungimea 
secventei recunoscute. O alta masura este dubla normalizare peste numarul 
de foni si numarul de esantioane acustice in fiecare fon. Aceste masuri nu 

^>0 . pot fi calculate direct utilizind Viterbi deoarece factorul de normalizare este 
diferit pentru cai de lungimi diferite. 

Fi e X = {xi, x 2 , . - . , x n , . . . , x N } secventa esantioanelor acustice in care 
cautam subsecventa W representata ca un Model Markov Ascuns (HMM) 
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inainte M avind starile: Q = {q u g 2> . . . , q u . . . , g L }. In spiritul considerati- 
ilor asupra masurilor de incredere cu normalizare simpla, potrivind M cu 
subsecventa A' 6 e = {x 6 , . . . , x e } si utilizind starea de umplutura q& inainte 
si dupa A/, obtinind un HMM M', putem calcula logaritmul posterior al 
£ modelului A/, in modul urmator: 



-logP(A/|A' 6 e ) - ]—t min -l og P(Q|X 6 e ) 



1 . . e " 1 



" e-6 + TvSlir {- lo 8 P (^)-pogW|x„) 

+ logP( 9 » + V)] -logP( 9 e |x e ) - logP( 9G |g e )} (1) 

unde Q = {<? 6 ,9 6+1 , <f} reprezinta una din caile de lungime e - 6 + 1 in 
Af , iar q n este starea HMM vizitata la momentul n de-a lungul lui Q. q G 
reprezinta modelul de umplutura. 

Pentru Recunoasterea Cuvintelor Cheie, definim scorul de recunoastere 



ca: 



S(M|*)=min -\ogP{M\Xt) (2) 

/5T si notam cu: 

< S 7 , in, out >= argmin \ - log P(Q\X£) (3) 

{Q,6,e} e ~ b + 1 

6-1 N—e 

Cu Q = {<? G , ...q G ,q b ,q b+l , g e , ^gT^g}, notam calea ce extinde Q cu 
6-1 stari ? G inaintea lui q b s\ N — e stari g G urmind <? e . In cazul utilizarii 
starilor de umplutura, calea S" este de obicei estimata: 

2^." S' ~ argmin -logP(Q|X) 

6-1 



- £ [logP(g n |x n ) + IogP(?" + V)] - logP( 9 € ix e ) 
-logP(9Gk e )- jz logP(q G \x n )} (4) 



n=e+l 
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pentru care P{qc\x n ) este egala cu o constanta e sau cu o variabila ca in 
cazurile mentionate in stadiul tehnicii. Aceast procedeu nu conducea in ge- 
neral la solutia definita in (2) si (3). In spiritul normalizarii simple noi 
propunem metoda Programarii Dinamice Iterative, descrisa in continuare, 
pentru calcularea unei valori pentru e ce garanteaza obtinerea segmentarii 
'optime' definite in (2). Acelasi rezultat ar putea fi obtinut prin normalizarea 
posteriorului cumulat pentru toate perechile posibile de puncte de inceput 
si sfirsit, si ar necesita un numar de teste proportional cu patratul lungimii 
secventei in care se cauta. Metoda inventata are calitatea aditionalade Timp 
Real la normalizarea simpla. 

Vom nota cu S£ calea S in HMM M* daca ea intra la esantionul b in starea 
q x din starea qc si iese la esantionul e din starea q L spre starea qc- 

Daca un obiect necesita pentru reprezentarea sa HMM tranzitii inapoi, se 
va realiza reprezentarea sa utilizind mai multe modele HMM inainte si care 
vor fi tratate ca subsecvente diferite. 

3.2 Metoda cu Normalizare Simpla 

Metoda iterativa de calculare a lui e: 

1. e se initializeaza cu Valoarea-DeJnitializare 
. 2. < w\S >=Viterbi(e) 

3. ciclu: 
S'=S 

e — w' 

4. < w' y S >=ViterbiI(c) 

5. daca S' diferit de S 
mergi la pasul 3 (ciclu) 
altfel 

raporteaza raspunsul S' retestat cu masuri aditionale de incredere 

Unde submetoda Viterbil consta in: 
Viterbil(e) 

1. Calculeaza calea SI folosind Viterbi clasic al M f peste X. 



2. w = - log P(M\X§) 

3. Raporteaza < w, S > 

Valoarea de initializare a lui e se poate alege la intimplare fara pierderea 
convergentei. Noi am obtinut rezultate foarte bune initializind-ul cu valoarea 
5". logaritmului posteriorului obtinut cu metodele descrise in starea tehnicii. In 
toate testele, aceasta metoda a convers in maximum 4 iteratii. 

Demonstrable corectitudinii vor fi publicate in scurt timp in literatura 
internationala de specialitate. 

Metoda este de citeva ordine de marime mai rapida decit alte abordari 
10. care ar garanta optimul teoretic definit de masura de incredere cu normalizare 
simpla. In plus, ea nu necesita un spatiu in memoria de calcul mai mare decit 
nici una din metodele cunoscute. Rezultatele in recunoasterea cuvintelor 
cheie se compara pozitiv cu rezultatele tehnicilor ce le cunoastem. 

3.3 Metoda cu Normalizare Dubla 

' Masura de incredere corespunzatoare se defineste ca: 

\ Ylfom - log posteriori 

Nr.Foni Parcursi fonieFo £r> Poreurti lungime fon, (D) 

Aceasta metoda consta intr-un algoritm de tip 'breadth first Beam search' 
caracterizat de absenta modelului de urnplutura, un set complex de reguli de 
reducere si de efectuarea anumitor normalizari: 
■ Starea q G are in aceasta metoda logaritmul posteriorului de emisie 0. 

Pentru fiecare esantion e si pentru fiecare stare s se calculeaza setul de pro- 
babilitati/cai de a avea esantionul e in starea s, ca primele N maxime ale 
masurii de confidenta pentru caile in HHM M' de lungime e si care se ter- 
^ mina cu starea s. Se pot elimina, deasemenea, cele care, potrivit regulilor 
20 . de reducere, vor pierde cu siguranta cursa finala in favoarea unor cai deja 
cunoscute. 

Notam cu a r , p x , l 1} a 2 , p 2 si l 2 masura de incredere pe fonii precedenti, 
posteriorul in fonul curent si lungimea in fonul curent pentru calea Q t respec- 
tiv Q 2 . Regulile ce pot fi utilizate la reducerea spatiului cailor, 'pruning' , 
'bO • pentru eliminarea lui Q x in favoarea lui Q 2 pot fi in acest caz fiecare din 
urmatoarele: 

1- h>h, A > 0, B < 0 si LlA + L C B + C> 0 
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2. h>h, A>Q,B>Os\C>0 

3. l 2 >lu A < 0, C > 0 si L 2 A + LB + C > 0 

4. z 2 >/ ls .4 = 0, B < 0 si LB + C > 0 

unde A = a x -a 2 , B = {a x - a 2 )(h + h) + Pi "P2, C=(ai -a 2 )M2+Pife-P2*i ) 
:f. L = L max - max{Zi,J 2 }> = -B/2A > 0 iar L rnal este lungimea maxima 
acceptata pentru un fon - echivalentul lungimii acceptate a unei stari din 
abordarile clasice. 

Eliminarea unei cai doar daca una din aceste reguli e satisfacuta, garan- 
teaza optimul definit de masura de incredere cu normalizare dubla, daca nici 
10- un fon nu poate fi evitat de HMM-ul M utilizat. Fiecare HMM inainte poate 
fi descompus in HMM-uri cu aceasta calitate. Regula a 4-a este inclusa in 
regula a 3-a si testarea sa e inutila daca aceasta din urma a fost deja testata. 

Primul test, l 2 > h ne spune de fapt daca Q 2 are sanse sa elimine Q u 
in caz contrar se va verifica daca Qi elimina Q 2 . Aceste teste se deduc din 
4 . conditiile asigurarii masurii de incredere maxime dupa efectuarea reducerilor. 
Pentru a utiliza metoda dublei normalizari fara a descompune HMM-uri ce 
evita anumiti foni, regulile anterioare se modifica considerind numarul de 
foni anteriori pentru fiecare cale F x respectiv F 2 si numarul de foni ce pot 
urma starii curente, 
to. Un test simplificat poate fi: 

• h > h, A > 0, pi > p 2 respectiv F 2 >Fi in cazul HHM-urilor ce pot 
evita foni. 

Acest test este mai slab decit regula 2. Exemplu: O cale este eliminata de 
o alta daca prima are o masura de confidenta inferioara (numeric mai mare) 
2^ ^ pe fonii anteriori, o lungime mai mica si minusul logaritmului posteriorului 
- cumulat in fonul curent deasemenea inferior (numeric mai mare) celei de a 
doua. O masura aditionala de incredere bazata pe lungimea maxima, L Tnax , 
si pe maximul minusului logaritmului posteriorului cumulat si normalizat in 
fon, Pmaxi e utila pentru garantarea unei limitari puternice a numarului de 
. cai stocate. 

• p > L max Pmax intr-o stare oarecare 

• £ > Pmax la iesirea din fon 
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unde p si 1 sint valorile in fonul curent pentru minusul logaritmului posteri- 
orului cumulat si pentru lungimea caii ce se elimineaza. Aceste teste permit 
eliminarea cailor prea lungi si care nu sint deosebit de performante, respectiv 
a cailor cu foni avind un scor inacceptabil, compensat de scoruri foarte bune 
in alti foni. 

Daca N se alege ca unu, regulile mentionate nu mai sint necesare, ci 
intotdeauna se propaga calea cu estimarea curenta a masurii de incredere 
maxime. Rezultatele obtinute sint deosebit de bune, chiar daca optimul 
definit se garanteaza pentru aceasta metoda doar cind N este mai mare ca 
lungimea secventei permise de L max sau a secventei ce se testeaza. 

Aceeasi abordare e functionala pentru normalizarea simpla unde HMM-ul 
subsecventei va fi format dintr-un singur fon. 

3.4 Metoda Potrivirii Reale 

Noi am definit, de asemenea, o noua masura de incredere care reprezinta 
bine cerintele recunoasterii. Deoarece fonii si starile absente pot fi modelate 
de catre HMM-urile utilizate, este normal sa se ceara potrivirea fiecarui fon 
din model cu o portiune din secventa. Prin urmare, noi consideram ma- 
sura de incredere a unei subsecvente ca fiind egala cu maximul pentru toti 
fonii, a minusului logaritmului posteriorului cumulat al fonului, normalizat 
cu lungimea sa. 

E/on-log posteriori 

foneFom ParcuTsi lungime fon v ' 

Regula ce poate fi utilizata in acest cadru la reducerea numarului de cai 
explorate este: 

• Q 2 se elimina in favoarea altei cai Q r daca masura de incredere a 
potrivirii reale pentru fonii anteriori este inferioara (numeric supe- 
rioara) pentru Q 2 fata de Q u si daca p x < p 2 si l 2 < h 

unde p u / x , p 2? l 2 reprezinta minusul logaritmului posteriorului cumulat 
respectiv lungimea masurata in esantioane in fonul curent pentru calea Q x 
respectiv Q 2 . 

Asemenea metodei precedente, limitarea numarului de cai considerate se 
face prin eliminarea celor care corespund criteriilor: 



* P L max P max 

intr-o stare oarecare 



• f > Pmax la iesirea din fon 

unde p si 1 sint valorile in fonul curent pentru minusul logaritmului posterioru- 
lui cumulat si pentru lungimea caii ce se elimineaza. Amintim ca semnificati- 
ile constantelor sint lungimea maxima, L maxi si respectiv maximul acceptat 
<) al minusului logaritmului posteriorului cumulat si normalizat in fon, Pmax- 

3.5 Performante 

Metodele prezentate anterior au fost testate in forma descrisa la punctul 4.2. 
Implementarea a testat aplicarea acestora pentru recunoasterea cuvintelor 
cheie. S-a construit curba ROC si s-a constatat ca metodele au dat rezultate 
\Q, superioare celor publicate in literatura de specialitate pentru alte experi- 
ente. Metoda dublei normalizari a dat rezultate superioare metodei simplei 
normalizari. 

4 Obiectul Inventiei 

4.1 Obiectul inventiei consta in: 

• metoda de recunoastere a subsecventelor utilizind calculul direct de 
masuri de incredere. 

• masura de incredere si metoda de recunoastere numita 'potrivire reala' 
si bazata pe potrivirea separata a fiecarui fon. 

• metodele de recunoastere utilizind normalizarea simpla si dubla 

• insotirea acestor masuri cu masurile aditionale de incredere mentio- 
nate aid, respectiv normalizarea dubla 3 lungimea maxima si limitarea 
potrivirii reale 

• Utilizarea metodelor anterioare la recunoasterea cuvintelor cheie 

• Utilizarea metodelor anterioare la recunoasterea subsecventelor in 
2^ structura materiilor organice 

• Utilizarea metodelor anterioare la recunoasterea de obiecte in imagini 
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4.2 Mod de executare, folosire si functionare 

Executarea: Este necesar un sistem de calcul, dar metoda poate de asemenea 
fi utilizata intr-o implementare hardware. 

• Se va obtine o reprezentare sub forma HMM a subsecventelor cautate 
^ (cuvint, profil proteine, sectiune imagine obiect). 

• Se obtine un instrument (eventual antrenat Ex: pentru recunoasterea 
vorbirii) de estimare a posteriorilor. De exemplu multi-gausiani, retele 
neuronale, clusteri, baze de date cu Profile Generalizate, etc. 

• Se implementeaza unul din algoritmii propusi. 
"JO. Pentru primul algoritm 

- Viterbil se implementeaza utilizind algoritmul clasic Viterbi cu 
modificarea ca, pentru fiecare pereche P = (esantion, stare) se 
propaga si momentele tranzitiilor intre starea q G si starile HMM 
M a caii ce ajunge la P. Acestea se mostenesc de la calea ce cistiga 

4 f . intrarea in perechea P, cu exceptia momentului cind se face decizia 

lor si anume cind ele primesc valoarea esantionului corespunzator. 

- w = - \ogP{M\X%) se calculeaza scazind din posteriorul cumulat 
calculat de algoritmul Viterbi pentru calea Q% valoarea (N-(e-b+ 
1))*£ corespunzind umpluturii si divizind rezultatul prin e-6+1. 

VO. Desigur, factorul e- 6 + 1 din formula precedenta va fi scos in afara 

fractiei. 

- Initializarea lui e se face cu o valoare medie asteptata. Se poate 
folosi si w calculat cind starea q G este asociata cu un posterior 
de emisie egal cu media celor mai bune K probabilitati de emisie 

^ ^ ' aIe esantionului curent. In acest caz, K se antreneaza utilizind 

tehnicile actuale cunoscute. 

Algoritmii urmatori, de tip 'Beam search', se implementeaza dupa 
descrierea din sectiunea corespunzatoare. Pentru fiecare pereche P = 
(esantion, stare) se calculeaza pentru fiecare cale asociata suma si 
A -)0 . lungimea din ultimul fon, precum si suma peste cumulul normalizat 
al fonilor precedenti (si numarul lor). Deasemenea, esantioanele de 
intrare si iesire in/din HMM-ul M sint calculate si propagate ca in 
metoda precedenta, pentru a asigura localizarea subsecventei. 
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Daca una si aceeasi subsecventa poate avea mai multe modele HMM, 
toate acestea se iau in considerare ca competitori. Acesta e cazul cu- 
vintelor cu multiple moduri de pronuntie sau obiectelor ce pot fi vazute 
diferit in diferite stari, pentru recunoasterea acestora in imagini. 

Dupa calculul masurii de incredere pentru fiecare model de subsecventa, 
se elimineaza cele cu o masura de confidenta in dezacord cu un 'thresh- 
old 5 antrenat pentru configuratia si scopul aplicatiei. De exemplu, pen- 
tru recunoasterea vorbirii cu retele neuronale si minus al logaritmului 
posteriorilor se va alege un 'threshold' maximal in punctul de func- 
tionare dorit al curbei ROC obtinuta in teste. 

Alternativele ramase se extrag in ordinea masurii de incredere si cu 
eliminarea alternativelor in conflict pina la epuizare. De fiecare data 
cind o alternative e eliminata, subsecventa cautata cu HMM corespun- 
zator e reestimata pentru portiunea ramasa disponibila ei in secventa in 
care se opereaza cautarea. Daca noua masura de incredere promoveaza 
testul 'threshold'-ului, atunci ea va fi inserata in pozitia corespunza- 
toare valorii in coada de alternative. 

Alternativele cu succes pot suporta teste de nivel superior ca de ex- 
emplu o intrebare de confirmare pentru recunoasterea vorbirii. opinia 
unui operator, etc. 

Pentru recunoasterea obiectelor in imagini: 

Posteriorii se obtin prin calculul unei distante intre culoarea starii mo- 
delului si cea a elementului din sectiunea imaginii. Daca conditiile 
de utilizare o impun, imaginea va fi preprocesata pentru a asigura o 
anumita normalizare (Ex: conditii schimbatoare de lumina vor face 
necesara o transformare de corectie bazata pe histograma). 

Fonilor din recunoasterea vorbirii le corespund parti ale obiectului. 
Structura (existenta tranzitiilor si probabilitatea lor) poate .fi schim- 
bata in functie de caracteristicile detectate ale caii curente. De exem- 
plu. detectind zone ale obiectului cu anumite lungimi, putem estima 
lungimea asteptata a zonelor ramase. Se va stabili astfel numarul de 
esantioane asteptat pentru starile viitoare si se va configura corespun- 
zator HMM-ul atasat obiectului. 

Se va scana o directie pentru detectarea unei potriviri optime si ulterior 
se vor scana celelalte directii pentru a descoperii noi potriviri. cit si 
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pentru a verifica cele existente. Testul final va fi certificat prin cross- 
corelatie sau prin analiza contururilor in pozitia generata de ipoteze. 

5 Aplicare Industriala 

Aici sint prezentate citeva exemple ale aplicatiilor metodei propuse in indus- 
trie: 

• Recunoasterea Cuvintelor Cheie incepe sa fie utilizata in raspunza- 
toarele automate ale sistemelor bancare, telefonice precum si in au- 
tomate de control, vinzare sau informare. Metoda ofera o posibilitate 
de recunoastere a cuvintelor cheie in vorbire continua cu vorbitori mul- 

40 tiph. 

• Recunoasterea secventelor in ADN este importanta in studiul genomu- 
lui uman. Una din cele mai mari probleme ale tehnicilor implicate 
consta in marea cantitate de date ce trebuie prelucrate. 

• Recunoasterea Obiectelor in Imagini isi are utilizarea, printre altele 
^ in cartografie si in conducerea robotilor industriali. Metoda permite 

estimarea rapida a pozitiei obiectelor in scena si poate fi urmata de 
teste suplimentare utilizind metode clasice de cross-corelatie. 
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Recunoa § terea Vorbirii §i Analiza Semnalelor 
prin cautarea directa a subsecven£elor cu 
Masuri Maxime de incredere 

Revendicarea Independenta 1. 

Preambul: 

Tst2(uZT &S lT Subsecvente "Prezentate ca Modele Markov 
Ascunse(HMM) , cautate ,ntr-o secventa oarecare. Ne referim la masuri de 
incredere uti hzate la reclasarea ipotezelor cistigatoare din Rec^noLterea Vor 
birn. Exemple de astfel de masuri sint: necunoasterea Vor- 

normalizarea simpla = posteriorul cumulat normalizat cu 

lungimea subsecventei 

normalizarea dubla = dubla normalizare peste numarul de 

foni si peste numarul de esantioane 
acustice in fiecare fon al posterioru- 
lui cumulat. 



caracterizata prin aceea ca: Permite masura suplimentara a increderii 
bazate pe extremele valorilor logaritmului posteriorului cumulat al fiecaru 
^normahzat cu lungimea sa. Aceasta masura am denumit o 

max S/ on - log posteriori 

10- foneFoui Parcursi lungime fon 

une"e miurii: dT" ^ & " Subsecve ^ <* ofera maximizarea 
uneia dintre masunle de incredere ammtite, peste toate potrivirile posibile 

caractenzata prin aceea ca: Permite reevaluarea alternativelor c o era 
I'cXr" 11061 maSUri ^ ""^^ menti ° nata > ^ ba - ltd Jlf Z 
caracterizata prin aceea ca: Calculeaza alternativa ce maximizes 'nor 
mahzarea s.mpla' utilizind metoda ce noi am numit-o 'Program"^ D fnam" a 
Iterate si care estimeaza posteriorul de emisie al starilor de umpmtuT L 
. mod ,terativ, ca fiind egal cu masura de incredere in iteratia anSara ' 



caracterizata prin aceea ca: Calculeaza alternativa ce maximizeaza 'nor- 
malizarea simpla', 'normalizarea dubla' sau 'potrivirea reala' prin utilizarea 
unui algoritm ce considera posteriorul de emisie al starii de umplutura ca 
mil. Aceasta metoda calculeaza progresiv, pentru fiecare pereche de esantion 
si stare a HMM, un set de alternative posibile de a ajunge acolo. 

Calcularea acestui set se bazeaza pe seturile de alternative ce conduc la 
starile ce pot fi asociate esantionului anterior celui curent. 

Acest set poate fi redus utilizind reguli caracteristice masurii de incredere 
si care asigura corectitudinea inferentei. 

Acest set poate deasemenea fi redus utilizind heuristici bazate pe regu- 
lile mentionate, pentru a mari viteza de calcul cu riscul diminuarii calitatii 
teoretice a recunoasterii. 



Recunoa § terea Vorbirii § i Analiza Semnalelor 
pnn cautarea directa a subsecven^elor cu 
Masuri Maxime de fncredere 

Revendicarea Dependenta 2. 

% . Preambul: 

Bazata pe Revendicarea 1. 

rostftf" eS " marea eXiStentei mvi " telOT si * P«itW lor in secvente 



10. 



caracterizata prin aceea ca: Utilizeaza metodele descrise in R B „„ n Hi 



0 



Recunoa§terea Vorbirii §i Analiza Semnalelor 
prin cautarea directa a subsecventelor cu 
Masuri Maxime de Incredere 

Revendicarea Dependenta 3. 

Preambul: 
Se bazeaza pe Revendicarea 1. 

Estimarea existentei subsecventelor biomoleculare si pozitiei lor in lanturi 
ale moleculelor organice (ADN) utilizind modele de tipul profilelor general- 
izate. 



caracterizata prin aceea ca: estimarea existentei si pozitiei se face cu 
metodele descrise in Revendicarea 1. pentru recunoasterea subsecventelor 
reprezentate prin Modele Markov Ascunse inainte. 



Recunoa§terea Vorbirii §i Analiza Semnalelor 
prin cautarea directa a subsecven£elor cu 
Masuri Maxime de Incredere 

Revendicarea Dependenta 4. 

Preambul: 

Se bazeaza pe Revendicarea 1. Realizeaza estimarea existentei obiectelor si a 
pozitiei lor in imagini utilizind metodele descrise in Revendicarea 1 pentru 
recunoasterea subsecventelor reprezentate prin Modele Markov Ascunse 



caracterizata prin aceea ca: Sectiuni ale imaginii obiectelor sint mcdelate 
prin setun de Modele Markov Ascunse. 

caracterizata prin aceea ca: se utilizeaza un model probabilistic bazat pe 
o distanta calculata intre culori. 

caracterizata prin aceea ca: Modelele Markov Ascunse ce modeleaza 
roluTfonilor Stn,CtUrate din P&rti disti "cte, ce joaca in cadrul metodei 

caracterizata prin aceea ca: Modelele obiectelor pot sa isi modifice intr-un 
mod dmamic proprietatile tranzitiilor (existenta si probabilitatea) pe baza 
mlormatiei acumulate de algoritmul de potrivire. 



Recunoa§terea Vorbirii §i Analiza Semnalelor 
prin cautarea directa a subsecven^elor cu 
Masuri Maxime de Incredere 

Rezumat 

Inventia se refera la metode de realizare a recunoasterii cuvintelor cheie 
in secvente rostite, a detectarii subsecventelor in lanturi de materii organice 
(ADN) si a recunoasterii obiectelor in imagini. Metodele cauta potrivirea 
ce maximizeaza, peste toate potrivirile posibile, anumite masuri de incredere 
bazate pe posteriori normalizati. Trei astfel de masuri de incredere sint exem- 
plificate, doua fiind inspirate dintr-o alta operatie in Recunoasterea Vorbirii, 
iar una este noua. 
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